SPSS超详细操作:单样本t检验
1、问题与数据
某研究者拟开展心理干预研究,招募了40位受试者。在实施该研究之前,他想了解这些受试者在抑郁分布方面是否具有代表性。因此,该研究者拟分析:受试者的抑郁评分均值与总体人群抑郁评分均值4.0是否存在统计学差异。
研究者收集了受试者的抑郁评分(dep_score)变量,部分数据如下:
2、对问题的分析
研究者拟分析样本均值与总体均值的不同,即判断招募受试者的抑郁评分均值与总体抑郁评分均值4.0之间是否有差异。针对这种情况,我们可以使用单样本t检验,但需要先满足4项假设:
假设1:观测变量为连续变量,如本研究中的抑郁评分变量为连续变量。
假设2:观测值相互独立,如本研究中各位受试者的信息都是独立的,不存在相互干扰作用。
假设3:观测变量不存在显著的异常值。
假设4:观测变量接近正态分布。
经分析,本研究数据符合假设1和假设2,那么应该如何检验假设3和假设4,并进行单样本t检验呢?
3、流程图
4、SPSS操作
4.1 检验假设的SPSS操作
(1) 在主页面点击Analyze→Descriptive Statistics→ Explore
弹出下图:
(2) 将dep_score变量放入Dependent List栏
(3) 点击Plots,弹出下图
(4) 取消对Descriptive栏内 Stem-and-leaf选项的选择,并点击Normality plots with tests选项
(5) 点击Continue, 点击Display栏的Plots选项
(6) 点击OK
4.1.1 假设3:不存在显著的异常值
在之前的讲解中(如一般线性回归和多重线性回归),我们为大家介绍了很多种检验异常值的方法。本章节中,我们主要介绍利用箱式图查找异常值的途径,SPSS输出箱式图如下:
一般来说,如果研究数据中存在显著的异常值,箱式图会以星号或者空心圆点的形式提示出来。如果数据值大于1.5倍箱距,数据的表示方式为空心圆点;如果数据值大于3倍箱距,数据的表示方式为星号。从上图可以看出,本研究数据中没有显著异常值,满足假设3。
为了让大家更好地了解箱式图提示异常值的方法,我们以下图为例介绍存在异常值的情况:
该图提示,男性组第6位受试者的数据为疑似异常值,数据值大于3倍箱距。同时,女性组的第26位受试者的数据也为疑似异常值,数据值大于1.5倍箱距。
(扩展阅读:怎么判别我的数据中存在特异值?教你几招!)
4.1.2 假设4:观测变量接近正态分布
当样本量小于50或者无法从正态Q-Q图上得出直观判断时,我们建议使用Shapiro-Wilk检验判断数据的正态分布情况。SPSS输出Shapiro-Wilk检验结果如下:
一般来说,如果数据接近正态分布,那么Shapiro-Wilk检验的P值就大于0.05;反之如果数据并不接近正态分布,那么Shapiro-Wilk检验的P值就小于0.05。从上图可以看出,本研究数据接近于正态分布(P>0.05),满足假设4。
(扩展阅读:SPSS教程:判断数据正态分布的超多方法!;SPSS详细操作:正态转换的多种方法)
4.2 单样本t检验的SPSS操作
(1) 在主页面点击Analyze→Compare Means→One-Sample T Test
弹出下图:
(2) 将dep_score变量放入 Test Variable(s)栏,并将对比的总体均值输入Test Value栏,在本研究中输入4.0
(3) 点击Options,弹出下图:
(4) 保留95%置信区间,并保留Missing Values栏中对 Exclude cases analysis by analysis选项的选择;点击Continue→OK
5、结果解释
5.1 统计描述
在进行结果解释之前,我们需要对数据有一个基本的了解。SPSS输出结果如下:
从该表可以看出,本研究的样本量是40(“N”栏)。这些受试者的抑郁评分均值为3.7225(“Mean”栏),标准差为0.73709(“Std. Deviation”栏)。由此可见,该研究中受试者的抑郁评分均值小于总体抑郁评分均值(4.0),但是该差别是否具有统计学意义呢?我们还需要通过单样本t检验进行深入的统计分析。
5.2 单样本t检验的结果解释
SPSS输出One-Samples Test表格如下:
Test Value栏提示本研究的标准均值是4.0,即我们在SPSS操作中人为输入的值。
从标注部分可以看出,受试者抑郁评分均值与总体人群抑郁评分均值的差值为-0.22750(“Mean Difference”栏),95%置信区间为-0.5132 到 -0.0418(“95% Confidence Interval of the Difference”栏)。从该表也可以看出t检验的统计结果,如下标注部分:
上表标注部分中各部分的含义如下:
从该部分可以看出,检验t值为-2.381(“t”栏),自由度为39(“df”栏),P值为0.022(“Sig.(2-tailed)”栏)。该结果提示在本研究中,受试者的抑郁评分均值与总体人群抑郁评分均值之间存在差异,即本研究受试者在抑郁分布方面的代表性不够好。
6、撰写结论
本研究采用单样本t检验判断受试者抑郁评分均值与总体人群抑郁评分均值(4.0)是否有差异。研究数据不存在显著异常值,且接近正态分布。
结果显示,受试者抑郁评分为3.73 ± 0.74,与总体人群抑郁评分均值的差值为0.28(95%置信区间为0.04-0.51)。单样本t检验结果提示,t(39) = -2.381, P = 0.021,说明受试者的抑郁评分均值与总体人群抑郁评分均值之间存在显著性差异,即本研究受试者在抑郁分布方面的代表性不够好。
(如果你想使用文中数据进行练习,请随时给小咖(微信:xys2016ykf)发消息,小咖将原始数据发给你。)
更多阅读
医咖会微信:medieco-ykh
关注医咖会,学习临床研究方法
有临床研究设计或统计难题?以下三种方式来帮你:
加小咖个人微信(xys2016ykf),拉你进统计讨论群和诸多小伙伴一起交流。
使用电脑进入医咖会官网:http://www.mediecogroup.com/,搜索类似问题及答案,或者直接提问!
直接点击左下角“阅读原文”,提出你的难题!